http://www.arocmag.com/article/02-2019-08-066.html 


基于 组 合 模型 的 交通 事故 严重 程度 预测 方法 
BER, BOM, IA, EA 


(南京 理工 大 学 a 计算 机 科学 与 工程 学 院 ; b. 电子 工程 与 光电 技术 学 院 ,南京 210094) 


摘 要 : 由 于 各 个 单一 分 类 模型 对 道路 交通 事故 严重 程度 预测 的 局 限 性 ， 为 提升 模型 预测 性 能 ， 和 致力 于 建立 一 种 组 合 
模型 。 结 合 卷 积 神经 网 络 提取 时 空 维度 中 的 特征 信息 ， 采 用 stacking 方式 将 CNN 与 XGBoost 组 合 ， 最 终生 成 道路 交 
通 事故 严重 性 的 分 类 模型 〈 多 层 提升 算法 )。 实 验 结果 表明 ， 此 模型 在 测试 集 上 预测 精度 为 91.51%， 组 合 模型 比 单一 
分 类 模型 具有 更 好 的 分 类 结果 。 基 于 组 合 模型 的 分 类 结果 ， 对 交通 事故 特征 进行 重要 性 排序 ， 开 展 特征 相关 性 分 析 ， 
为 减少 道路 交通 事故 及 减轻 道路 交通 事故 严重 等 级 的 管理 措施 提供 参考 依据 。 
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Abstract: As the limitations of the single classifier on traffic accident severity, an ensemble approach is proposed for improving 
the prediction performance. Using CNNs to extract the features from the spatial dimension, getting an ensemble approach with 
XGBoost and CNN by stacking (multi-level boosting algorithm) . The predicting precision of the approach is 91.51% on the 
validation set. In comparison with the single classification model, the result of the experiment shows a better performance. For 


providing useful information for reducing the number of traffic accidents and downgrading the severity of traffic accident, the 


paper gives out a correlation analysis by sorting the features based on the predictions. 
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度 的 影响 ， 从 而 提出 行 之 有 效 的 解决 方案 ， 以 减轻 道路 事故 严 

重 性 和 减少 道路 交通 事故 。 近 年 来 ， 国 内 外 学 者 已 经 对 道路 交 

当今 世界 ， 道 路 交通 事故 已 对 社会 造成 严重 的 危害 ， 成 为 ”” 通 事故 严重 性 预测 问题 进行 了 大 量 研究 驻 六 ， 国 内 道路 交通 事 

见 代 化 交通 运输 中 蝇 需 解决 的 一 个 重要 问题 。 在 我 国 ， 道 路 交 。” 故 严重 程度 预测 研究 如 马 壮 林 等 采用 有 序 Logit 模型 和 广义 
通 事 故 每 年 都 会 造成 巨大 的 人 员 伤 亡 和 经 济 损失 , 2016 FIER Logit 模型 ， 建 立 公 路 隧道 交通 事故 严重 程度 预测 模型 所 ;刘海 
生 各 类 道路 交通 伤亡 事故 超过 15 万 ， 死 伤 超过 10 万 余人 口 , 直 际 等 从 宏观 层面 第 选 道 路 交通 事故 的 主要 影响 因素 ， 将 事故 严 
接 经 济 损失 50 亿 余 元 。 因此 , 对 道路 交通 事故 严重 程度 进行 科 ” 重 程 度 划 分 为 三 个 等 级 ， 建 立 基 于 累积 Logistic 回归 模型 的 道 
学 预测 ， 并 结合 预测 结果 进行 诱因 分 析 ， 掌 握 严 重 程度 较 高 的 ”路 交通 事故 严重 程度 预测 模型 四。 国外 道路 交通 事故 严重 程度 
道路 交通 事故 的 发 生 、 发 展 、 分 布 规律 与 特征 ， 依 此 规律 和 特 ”预测 研究 如 文献 [8], 通 过 选取 事故 严重 程度 相关 数据 特征 ( 後 事 
征 为 最 大 程度 规避 严重 交通 事故 发 生 的 风险 提出 行 之 有 效 的 交 车 行驶 速度 、 秘 事 车 类 型 、 安 全 气囊 状态 等 ) 建立 事故 严重 程 
通 安全 对 策 ， 成 为 当前 亚 需 解决 的 问题 。 度 智 能 分 类 系统 来 为 紧急 服务 机 构 提供 指导 意见 : Sameen 等 
道路 交通 事故 严重 程度 预测 是 以 道路 交通 微观 环境 活动 作 。 ”人 外 则 采用 递归 神经 网 络 建立 深度 学 习 模型 对 事故 严重 性 进行 
为 考察 对 象 ， 研 究 各 个 有 关 变 量 分 布 及 其 变动 对 于 事故 严重 程 。 分 类 等 。 由 于 事故 数据 为 序列 化 数据 ， 在 时 空 上 具有 一 定 关联 
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录用 稿 AER, F: 基于 组 合 模型 的 交 


性 ，O"Donnell 等 人 03 采 用 有 序 Logit 模型 和 有 序 probit 模型 ， Fukishima 等 人 在 1980 年 提出 05., LeCun 在 1998 年 对 BP 算法 
分 析 事 故 严重 程度 与 驾驶 人 属性 和 车 辆 特征 之 间 的 关系 ; 优化 进一步 提升 CNN 人 性 能 09,2012 年 CNN 在 ImageNet 
Sameen patie 建立 递归 神经 网 络 来 捕获 数据 之 间 的 时 LSVRC-2012 contest08 中 取得 了 极 高 的 准确 度 最 终 将 CNN Fi 

空 关联 ， 通 过 添加 多 个 长 短 时 记忆 模型 最 终 通过 两 个 全 连接 层 。” 究 推 向 高 潮 。 
和 softmax eet ee 事故 严重 性 分 类 。 CNN 结构 如 图 1 所 示 。 由 图 1 可 知 ，CNN 主要 包含 : 卷 
在 目前 交通 事故 严重 程度 预测 模型 中 ， 更 多 根据 事故 结果  ” 积 层 (convolutional layer)、 线 性 整流 层 (rectified linear units layer, 
信息 预测 事故 严重 程度 ， 没 有 获取 足够 路 段 信 息 ， 如 马 壮 林 等 ReLU layer)、 池 化 (pooling) 层 、 全 连接 层 、 损失 函数 层 。 CNN 
人 采用 有 序 Logit 模型 和 广义 Logit 模型 建立 公路 隧道 交通 事 ” 相 比 于 传统 神经 网 络 具 有 以 下 优点 : 能 够 获取 非 结构 性 数据 
故 严 重 程度 预测 模型 中， 在 Fogue 等 人 [SI 建立 的 事故 严重 程度 ”的 区 域 关 联 信息 ; b) CNN 实现 了 特征 提取 的 封装 , 简化 训练 过 
智 
通 


分 类 系统 ， 其 目的 在 于 紧急 服务 机 构 提 供 指 导 意见 ， 没 有 F: c) 同 时 学 习 和 产生 信息 提取 和 分 类 ; 四 权重 共享 可 以 减少 网 
通过 相关 数据 特征 分 析 事 故 发 生 主要 原因 ; ”Sameen SAPIX = 络 的 训练 参数 ， 使 神经 网 络 结构 变 得 更 简单 ， 适 应 性 更 强 09。 
用 递归 神经 网 络 建立 深度 学 习 模型 对 事故 严重 性 进行 分 类 ， 通 CNN 也 有 一 些 缺 点 : a)CNN 的 特性 使 其 难以 泛 化 ; b) 由 于 卷 积 
过 照明 情况 、 路 表情 况 等 道路 信息 特征 以 及 事故 发 生 时 间 等 环 层 和 池 化 层 的 计算 量 庞大 ， 使 CNN 的 研究 依赖 于 硬件 性 能 的 
境 特 征 对 事故 严重 性 分 类 ， 但 此 模型 并 没有 获取 邻近 路 段 信 息 。 支持 M41。 卷 积 神经 网 络 目前 广泛 应 用 于 影像 识别 、 视 讯 分 析 、 
特征 且 在 验证 集 上 预测 精度 为 71.77%。 因 此 ， 提 升 道路 交通 事 自然 语言 处 理 、 药 物 发 现 和 围棋 等 多 个 领域 。 

故 严重 程度 预测 精度 并 依 此 对 事故 发 生 原 因 进行 诱因 分 析 成 为 1.2 XGBoost 


x 


prac E nance 基于 上 述 文献 分 析 ， XGBoost 由 Chen @ AMI 2016 年 提出 ， 它 基于 GBDT 
本 文通 过 路 号 获取 事故 地 点 邻近 道路 信息 ， 结 合 卷 积 神经 网 络 (又 名 MART, multiple additive regression tree)， 是 一 种 迭代 的 


提取 道 Rete 采用 stacking 方式 将 CNN 与 。” 决策 树 算法 ， 该 算法 由 多 棵 决策 树 组 成 ， 所 有 树 的 结论 累加 起 

XGBoost 组 合 ， 最 终生 成 道路 交通 事故 严重 性 的 分 类 模型 (多 ”来 做 最 终 答案 号)， 对 GBDT 进行 优化 ， 提 供 缓存 感知 预 读 取 

层 提 升 算法 ), 并 依据 分 类 模型 的 预测 结果 进行 诱因 分 析 , 为 减 。” 技术、 分布 式 外 存 计算 技术 、AllReduce 容错 工具 提高 现 有 提升 

少 道路 交通 事故 及 减轻 道路 交通 事故 严重 等 级 的 管理 措施 提供 。” 树 增 强 算法 运算 速率 ， 解 决 当前 提升 树 增强 算法 局 限于 百 万 级 

参考 依据 。 别 数据 量 的 问题 ， 提 升 算法 运行 速率 。XGBoost 的 结构 如 图 2 
所 示 ， 有 具体 介绍 详 见 文献 [22，23] 。 


aa 


1 ” 卷 积 神经 网 络 与 XGBoost 简介 


1.1 卷 积 神经 网 络 
卷 积 神经 网 络 (convolutional neural network, CNN) 最 早 由 


Input (Image data, Full-connect Layer Soft-max Layer 
Spatio-Temporal 
Data,etc) 


图 1 卷 积 神经 网 络 结构 图 


tree1 tree2 


Instanceindex gradient statistics 
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图 2 XGBoost 模型 结构 和 评分 方法 
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录用 稿 
2 ”模型 建立 
2.1 强 关 联 规则 特征 选择 方法 


根据 GA1082 一 般 事故 采集 标准 ， 深 圳 市 事故 数据 集 对 每 


起 事故 采集 了 69 条 特征 ， 本 文 依照 交通 安全 工程 09 对 特征 分 
E 


ll: If V,>vanddA, >A then 
12: M on, <7 getFeatures (Osa) 

13: Add 
14: endif 


M,,,. to M without repetition 


15: t<t+l 


类 ， 详 情 如 表 1 所 示 。 16: end while 
表 1 2014-2016 年 深圳 事故 数据 特征 分 类 17: Output: M 
大 类 小 类 特征 表 2 强 关 联 特征 选择 的 特征 集合 
公路 行政 等 级 ,公里 数 , 单 向 路 宽 ,双向 路 宽 ,路 面 结构 ,路 面 附着 系数 ,道路 小 类 特征 
一 类 型 ,道路 线 型 ,长 下 坡 路 段 ,在 道路 。 横 断面 位 置 事故 多 发 点 段 ,交通 标志 标 线 完 善 ,其 他 交通 安全 设施 不 全 ， 
道路 特征 城市 道路 路 口 路 段 类 型 邻近 三 段 道 路 路 侧 防护 设施 类 型 ,路 口 路 段 类 型 ,路 面 状 况 ,路 面 结构 ,交通 
交通 管理 设施 交通 信号 方式 (控制 ) ,交通 标志 标 线 完善 特征 言 号 方式 《控制 ), 道 路 安全 属性 ,道路 安全 隐患 督办 等 级 ， 
安全 防护 设施 ”中央 隔离 设施 ,其 他 交通 安全 设施 不 全 ,路 侧 防 护 设施 类 型 ,道路 物理 隔离 道路 物理 隔离 ,道路 类 型 ,道路 线 型 ,长 下 坡 路 段 
天 气 条 件 天 气 ,能 见 度 路 宽 ,中 央 隔 离 设施 ,是 否 双 道 ,事故 多 发 点 段 ,交通 信号 方式 
环境 特征 事故 多 发 点 段 ,地 形 ,照明 条 件 ,路 表情 况 ,路 面 状况 ,道路 安全 属性 ,道路 安 (控制 ), 交 通 标志 标 线 完善 ,其 他 交通 安全 设施 不 全 ,在 道路 横 
i 全 隐患 督办 等 级 本 路 段 特 征 ”断面 位 置 ,地 形 ,照明 条 件 ,路 口 路 段 类 型 ,路 表情 况 , 路 面 状 况 ， 
事故 基本 信息 。 所 属 中 队 , 文 书 状态 ,所 辖 乡镇 ,现场 ,行人 数量 ,行政 区 划 , 调 解 人 , 米 数 路 面 结构 ,道路 安全 属性 ,道路 安全 隐患 督办 等 级 ,道路 物理 
事故 时 空 信息 事故 发 生 时 间 , 事 故地 点 ,路 号 ,路 名 隔离 ,道路 类 型 ,道路 线 型 ,长 下 坡 路 段 ,路 侧 防 护 设施 类 型 
事故 原因 信息 事故 认定 原因 ,事故 认定 原因 分 类 小 类 环境 特征 是 否 节 假日 ,是 否 白 天 ,天 气 ,能 见 度 
事故 特征 = 事故 形态 ,事故 严重 程度 ,单车 事故 ,是 否 简易 程序 ,路 外 事故 类 型 ,车 辆 间 2.2 事故 严重 程度 预测 方法 
ne E 在 深度 学 习 中 ， 特 征 通过 不 同 层 之 间 进行 信息 传递 ， 本 文 
peice 受伤 人 数 ,当事人 总 数 ,抢救 死亡 人 数 ,机 动车 数量 ,死亡 人 数 ,直接 财产 受 此 启发 ,采用 stacking 的 方式 将 CNNs 与 xgboost 组 合 :CNNs 
损失 ,重伤 人 数 , 轻 伤 人 数 ,行人 数量 , 非 机 动车 数量 提取 预测 路 段 及 邻近 的 三 条 路 段 道路 特征 的 空间 信息 ， 将 提取 
表 1 可 知 ， 本 文采 用 {道路 特征 , 环境 特征 , 事故 严重 程 的 空间 信息 结合 其 他 特征 , 结合 xgboost 进行 stacking 组 合 , 在 
度 } 为 数据 集 , 以 事故 严重 程度 为 预测 目标 , 使 用 道路 特征 和 环 此 命名 为 多 层 提升 算法 ， 算 法 伪 代 码 见 算法 2， 算 法 流程 图 如 
境 特征 预测 事故 严重 程度 ， 寻 求 道 路 特征 与 环境 特征 对 于 事故 图 3 所 示 。 
严重 程度 的 影响 。 多 层 提升 算法 每 层 包 括 一 个 CNNs 提取 空间 数据 信息 输出 
本 文 使 用 一 种 强 关联 规则 特征 选择 算法 ， 通 过 关联 规则 进 3-dim 空间 信息 的 增强 特征 ， 结 合 其 他 特征 代入 xgboost， 预 测 


行 特征 选择 ， 优 先 选取 后 件 为 标签 的 短 规则 ， 达 到 减 小 特征 空 
间 维 度 的 目的 ， 算 法 伪 代 码 见 算法 1。 


基于 强 关联 规则 特征 选择 算法 结果 ， 获 取 预 测 路 段 及 邻近 在 增 
三 条 道路 特征 集合 ， 并 结合 本 路 段 其 他 特征 集合 预测 道路 交通 下 一 层 时 使 用 k 折 交 叉 验证 ， 若 预测 结果 没有 明显 提升 则 停 
事故 严重 程度 ， 特 征 选择 算法 结果 详 见 表 2。 拓展 下 一 层 。 
算法 1 强 关联 规则 特征 选择 算法 算法 2 多 层 提 升 算法 


一 层 的 CNNs 和 xgboost。 最 终 ， 使 用 argmax 确定 预测 结 
多 层 提升 算法 的 层 数 自动 确定 ， 受 deep forest29 启 发 ， 


1: Input: data set X , feature set F, association rule set Y, true 


‘OO ON Dn A wm N 


10: 


rule set 中 target label y, iteration number T , support 
threshold A, confidence threshold V, final feature set M 
Initialize Y < Apriori(X, F), t<-0, M<{} 
for pinYY then 
If yin andiift(y,p)>1 then 
Add P to 中 
end if 
end for 
P sort ($) 
while t < T do 


Get Ops from @ 


EWO EJER, YAA 3-dim 结果 向 量 ， 并 作为 增强 特征 代入 下 


pami 


J 


T 


1: Algorithm configurations: parameters in CNN, parameters 


in XGBoost 


2: Input: data set X (include spatial features X , other 


s 


features X,)> target label y, cross validation parameter 
performance estimation A 

3: Initialize performance’tstimationWY <1, level 1<0O 
4: while y> À then 

5: If [==0 then 

6: J,_,<-h_CNNs(X,) 

7: fit CNNs( X,, y) 

8: Iyo ,<h_XGBoost(X,, y,) 


9: fit XGBoost( X,Y, ; sy) 


k, 
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10: VV <- kFold_estimation(X,y,k ) 16: fit XGBoost( X,,Y, 1 sy) 
11: end if 17: V<kFold_estimation(X, y,k ) 
12: IL<Il+1 18: end while 
13: Y, , <h_CNNs(X,) 19: Y=argmax(Yyq 1) 
14: fit CNNs( X,,V yg 15 y) 20: Output: ŷ 


15: yo ı h_XGBoost( X, Y,) 


Spatial Features 
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图 3 多 层 提 升 算法 流程 图 
表 3 中 acc-on-trainSet 表示 模型 在 用 于 模型 拟 合 的 训练 集 
3 ”实验 分 析 ey A ein 
中 的 准确 率 ，acc-on-cyv 表示 模型 基于 5 折 交 又 验 证 对 于 测试 身 
3.1 基于 组 合 模型 的 预测 结果 的 预测 准确 率 ，test-merror-mean、test-merror-std、train-merror- 
本 文 实验 数据 由 道路 交通 安全 研究 信息 共享 平台 的 深圳 市 mean 和 train-merror-std 是 以 交叉 验证 为 基础 的 评估 指标 ，test- 
道路 交通 事故 数据 分 析 竞 赛 提 供 , 数据 内 容 包含 深圳 市 2014 至 merror-mean 表示 在 cv 集合 中 多 个 测试 集中 多 分 类 误差 平均 值 ， 
2016 年 20 余 万 条 交通 事故 信息 ， 包 括 伤亡 事故 和 轻微 事故 。 test-merror-std 表示 多 个 测试 集中 多 分 类 误差 的 标准 差 ，train - 
本 文通 过 数据 提供 的 道路 信息 和 环境 信息 ， 预 测 不 同事 故 的 严 merror-mean 表示 多 个 训练 集中 多 分 类 误差 平均 值 ，train- 
重 程度 ， 并 采用 5 折 交 叉 验 证 对 预测 结果 进行 评估 。 本 文 根 据 merror-std 表示 多 个 训练 集中 多 分 类 误差 的 标准 差 。 由 表 3 可 
数据 预 处 理 结果 使 用 对 应 分 类 模型 对 数据 预测 。 得 : a) 无 论 是 RF、XGBoost 或 组 合 模型 ， 模 型 总 是 在 训练 集 上 
多 层 提升 算法 基于 5 折 交 叉 验证 结果 对 模型 参数 调整 ， 确 拟 合 效果 最 好 ， 模 型 都 偏 于 过 拟 合 ;b) 组 合 模型 相对 于 RF 或 
定 层 数 为 2 层 。 最 终 ， 采 用 5 折 交 叉 验 证 对 此 模型 预测 精度 进 XGBoost 单个 模型 ， 在 训练 集 和 交叉 验证 的 测试 集 上 表现 都 更 


nt 


行 评 估 ， 多 层 提升 算法 预测 精度 为 91.51%。 好 ， 且 组 合 模型 在 交叉 验证 的 测试 集 上 的 多 分 类 误差 的 标准 差 
3.2 ”误差 分 析 及 比较 为 3.90%， 模 型 表现 较为 稳定 且 良 好 。 
为 了 进一步 验证 多 层 提升 算法 的 准确 性 ， 使 用 单 3.3 诱因 分 析 
XGBoost 模型 、 单 一 RF 模型 (random forest) 与 多 层 提 升 算法 根据 基于 组 合 模型 的 预测 结果 ， 根 据 道路 交通 专家 意见 ， 
分 类 预测 结果 进行 对 比 ， 可 以 判断 各 模型 的 准确 性 ， 详 情 如 表 在 组 合 模型 特征 重要 性 排序 图 的 基础 上 ， 本 文 寻求 道路 信息 特 
3 所 示 。 征集 合 和 环境 信息 特征 集合 中 对 道路 交通 事故 严重 性 预测 结果 
表 3 不 同 模型 预测 精度 比较 产生 重要 影响 的 特征 ， 并 依 此 进行 道路 交通 事故 的 诱因 分 析 ， 
ee 模型 模型 重要 性 排序 信息 如 图 4 所 示 。 由 图 4 可 得 , 路 宽 、 能见度 、 
ae RF  XGBoost 多 层 提升 算法 路 侧 防 护 设施 类 型 、 路 口 路 段 类 型 、 道 路 物理 隔离 和 交通 信号 
acc-on-trainSet 97.29% 97.42% 99.57% FAH Gel AST ORBEA. 
acc-on-cv 74.32% 71.69% 91.51% 在 图 6 和 7 中 ， 对 分 类 变量 的 不 同 分 类 进行 了 数值 变换 ， 
test-merror-mean 25.68% 28.31% 8.49% 其 中 “交通 信号 方式 (控制) ”中 1- 无 控制 ，2- 民 警 指 挥 ，3- 信 和 号 
test-merror-std 16.17% 2.12% 3.90% 灯 ，4- 标 志 ，5- 标 线 ，6- 其 他 ， 本 实验 由 1-6 组 合 为 11 种 类 别 ， 
train-merror-mean 2.71% 2.05% 0.36% 其 他 特征 对 应 数值 的 解释 详情 如 表 4 所 示 。 
train-merror-std None 0.28% 0.11% 由 图 6 和 7 可 得 : 
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a) 路 宽 。 由 图 6 中 “路 宽 ” 与 “事故 类 型 ”的 双 变 量 关 系 ” ”信号 方式 (控制 )” 为 8 的 情况 下 ， 即 由 标志 和 标 线 组 成 的 交通 
图 可 得 ， 死 亡 事故 和 伤 人 事故 更 易 出 现 于 路 宽 较 大 的 路 段 ， 相 “控制 方式 。 由 图 7 中 “交通 信号 方式 〈 控 制 )” 与 “事故 类 型 ” 
对 伤 人 事故 , 死亡 事故 更 集中 于 路 宽 较 大 的 路 段 。 由 图 7 中 “路 的 双 变 量 关 系 图 可 得 ， 相 对 于 财产 损失 事故 ， 此 种 控制 情况 下 
宽 ” 与 “事故 类 型 ”的 双 变 量 关 系 图 可 得 ， 两 变量 pearsonr 相 更 易 出 现 伤 人 事故 和 死亡 事故 ， 且 “交通 信号 方式 (控制 )” 与 
关系 数 为 0.23， 且 假设 pearsonr=0 的 p 值 估计 为 0.0088， 说 明 “事故 类 型 ”两 变量 pearsonr 相关 系数 为 0.32, 假设 pearsonr=0 
“路 宽 ” 与 “事故 类 型 ”有 一 定 的 相关 性 。 的 p 值 估计 为 0.00022， 说 明 “ 交 通信 号 方式 〈 控 制 )” 与 “ 寻 
b) 交 通信 号 方式 (控制 )。 由 图 6 中 “交通 信号 方式 (控制 )” 故 类 型 ”有 一 定 的 相关 性 。 

与 “事故 类 型 ”的 双 变 量 关 系 图 可 得 ， 事 故 更 易 出 现 于 “交通 
表 4 不 同 特征 数值 解释 表 


hin 
pus 


T 


特征 数值 解释 特征 数值 解释 
1 其 他 安全 设施 1 绿化 带 
2 356 2 混凝土 护 拦 
3 56 路 侧 防 护 设 3 防护 墩 ( 柱 ) 
4 34 施 类 型 4 行道 树 
16 5 金属 护 拦 
交通 信号 方 
3456 6 无 防护 
式 〈 控 制 ) 
456 
1 中 心 隔离 
8 45 
9 345 
2 机 非 隔离 
10 无 信号 道路 物理 隔 
11 标 线 离 = SR 
3 中 心 隔离 加 机 非 隔离 
1 三 枝 分 叉 口 
2 四 枝 分 叉 口 D 
4 无 隔离 
3 多 枝 分 又 口 
4 不 行 交 叉 1 50m 以 内 
5 普通 路 段 2 50~ 100m 
能 见 度 
变 窗 路段 3 100~200m 
路 口 路 段 类 
路 侧 险 要 路 段 4 200m 以 上 
= 8 [re ie 
1 财产 损失 事故 
9 路 段 进 出 处 
事故 类 型 ( 即 
10 高 架 路 段 E E ER 
事故 严重 程 2 伤 人 事故 
11 桥梁 
度 ) 
12 隧道 
3 死亡 事故 
13 其 他 特殊 路 段 
c) 能 见 度 。 由 图 6 中 “能 见 度 ”与 “事故 类 型 ”的 双 变 量 “事故 类 型 "的 双 变 量 关 系 图 可 得 ,相对 于 其 他 路 侧 防 护 设 施 ， 
关系 图 可 得 ， 道 路 交通 事故 并 非 出 现 于 能 见 度 很 低 的 情况 下 ， 、2 和 6 路 侧 防 护 设 施 类 型 下 ， 即 绿化 带 、 混 凝 土 护栏 和 无 防 
如 图 可 知 ， 大 多 数 道路 交通 事故 出 现 于 能 见 度 为 4 的 情况 下 ， 护 ， 道 路 交通 事故 发 生 概率 更 大 ， 且 相对 于 财产 损失 事故 ， 路 
即 能 见 度 200m 以 上 ， 相 对 于 财产 损失 事故 ， 伤 人 事故 和 死亡 侧 防 护 设施 类 型 1 和 6 更易 导致 伤 人 事故 和 死亡 事故 ， 即 绿化 
和 故 更 易 出 现 于 能 见 度 为 4 的 情况 下 。 由 图 7 中 “能 见 度 ” 与 带 和 无 防护 。 由 图 7 中 “路 侧 防 护 设 施 类 型 ”与 “事故 类 型 ” 


alin 


“事故 类 型 ”的 双 变 量 关 系 图 可 得 ， 相 对 于 财产 损失 事故 ， 能 ”的 双 变 量 关系 图 可 得 ,“ 路 侧 防 护 设施 类 型 ”与 “事故 类 型 ”两 
SURE 200m 以 上 的 情况 下 更 易 出 现 伤 人 事故 和 死亡 事故 , H“ Ae 变量 pearsonr pees 0.087, ‘Eve pearsonr=0 的 p 值 估 计 
见 度 ” 与 “事故 类 型 ”两 变量 pearsonr 相关 系数 为 0.038, 假设 ”为 0.33， 说 明 “ 路 侧 防 护 设施 类 型 ”与 “事故 类 型 ”关联 度 不 

pearsonr=0 的 p 值 估计 为 0.67, 说 明 “ 能 见 度 ”与 “事故 类 型 ” Ks 
关联 度 不 大 。 e) 道 路 物理 隔离 。 由 图 6 中 “道路 物理 隔离 ”与 “事故 类 
d) 路 侧 防护 设施 类 型 。 6 中 “路 侧 防护 设施 类 型 ”与 型 ”的 双 变 量 关 系 图 可 得 ， 相 对 于 其 他 路 侧 防 护 设 施 ， 道 路 物 


X 
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理 隔离 类 型 1、4 下 ， 即 中 心 隔 离 和 无 隔离 下 ,道路 交通 事故 发 。 亡 事故 发 生 次 数 更 多 ; 相对 于 机 非 隔离 和 中 心 隔离 加 机 非 隔离 ， 
生 概 率 更 大 。 由 图 7 中 “道路 物理 隔离 ”与 “事故 类 型 ”的 双 ”道路 物理 隔离 类 型 为 中 心 隔离 或 无 隔离 的 情况 下 ， 道 路 交通 事 
变量 关系 图 可 得 ,“ 路 侧 防护 设施 类 型 ”与 “事故 类 型 ”两 变量 故 发 生 概 率 更 大 ; 且 在 四 枝 分 义 口 路 段 更 易 发 生 伤 人 事故 。 基 
pearsonr 相关 系数 为 0.17, 假 设 pearsonr=0 的 p 值 估计 为 0.053， 此 我 们 应 根据 上 述 数据 描述 结果 采取 合理 手段 减轻 道路 交通 事 
说 明 “ 道 路 物理 隔离 ”与 “事故 类 型 ”有 一 定 的 关联 性 。 故 严重 程度 以 及 尽量 避免 道理 交通 事故 。 

路口 路 段 类 型 。 由 图 6 中 “路 口 路 段 类 型 ”与 “事故 类 Fei ps Reng i 
型 ”的 双 变 量 关 系 图 可 得 ， 大 部 分 道路 交通 事故 都 发 生 在 路 口 40 
路 段 类 型 2 和 5 的 情况 下 ， 即 四 枝 分 义 口 和 普通 路 段 ， 且 相对 = 


于 财产 损失 事故 和 死亡 


事故 。 由 图 
系 图 可 得 ,“ 路 
关系 数 为 -0.3， 
口 路 段 类 型 ”与 
综 上 所 述 


由 


区 


口 路 


“oe 


事故 类 型 ”的 关联 性 很 强 。 
， 相 对 于 财产 损失 事故 ， 在 道路 较 宽 的 路 段 易 出 


事故 ， 路 
7 中 “路 口 路 段 类 型 ”与 
段 类 型 ”与 “事故 类 型 ”两 变量 
段 设 pearsonr=0 的 p 值 估计 为 0.00051, 说 明 “ 路 


现 严重 程度 更 高 的 事故 ;在 由 标志 和 标 线 组 成 的 交通 控 


口 路 段 类 型 2 下 更 易 发 生 伤 人 
“事故 类 型 ”的 双 变量 关 


量 pearsonr 相 


N Q 
a 


Feature Importance Score 


DAEN 


更 易 出 现 伤 人 事故 和 和 死亡 事故 ， 且 不 同 于 “恶劣 天 气 更 易 发 生 


重 道路 交通 事 


He”, 数据 显示 能 见 度 为 4 的 情况 下 , 即 能 见 度 


200m 以 上 ; 相对 于 财产 损失 事故 , 伤 人 事故 和 死亡 事故 出 现 次 


数 更 多 ， 相 对 于 其 他 路 侧 防 护 设施 ， 
道路 交通 事故 发 生 概率 更 大 ， 且 相对 于 财产 损失 事故 ， 


防护 ， 


路 侧 防 护 设施 类 型 


绿化 带 、 混 凝 土 护 栏 和 无 


为 绿化 带 和 无 防护 的 情况 下 ， 伤 人 事故 和 死 


& HB tM H y 


EE 


_ RREBSES aR 


= -— WN 
oun 


O 


oO 


ou 


路 宽 
能 见 度 B 
照明 条 件 M 


路 侧 防 护 设施 类 型 国 本 本 


天 气 


道路 类 型 于 
交通 信号 方式 (控制 ) EE 


中 央 隔 离 设 施 国 国 加 
道路 物理 隔离 Mi 


RI 


4 模型 特征 重要 性 


XGBoos | | ycBoost | 今 中 上 ee 
Level 0 Level 1 
5 本 文 的 多 层 提升 算法 架构 
3 | 
通 3 
信 。 能 
号 见 
方 4 E’ 
式 
( 控 > 
制 ) 
事故 类 型 事故 类 型 
通 | 路 
道 : Oo, 
物 路 
理 ， | | 段 。 | | 
隔 - 设 
离 施 * 
事故 类 型 ”事故 类 型 
不 同 特征 与 “事故 类 型 ”关系 图 (小 提琴 图 ) 


是 否 双 道 Mi 


地 形 国 

是 否 白天 国 

路 表情 况 E 
是 否 节假日 
道路 安全 属性 


排序 
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4 


出 了 基于 组 合 模 型 的 交通 事故 严重 程度 
经 网 络 提取 时 空 维度 中 的 特征 信息 ， 
与 XGBoost 组 合 


H4 Ot olo ik BB Bt 


$ô 


事故 类 型 


© 


事故 类 型 


事故 


Wee eS as SSF BSB 
EELA 


对 


7 不 同 特征 与 “ 事 


结束 语 


本 文 根 据 2014-2016 年 深圳 道路 事故 数据 的 实际 情况 ， 提 


预测 方法 ， 结 合 卷 积 神 
J stacking 方式 将 CNN 
， 最 终生 成 道路 交通 事故 严重 性 的 分 类 模型 
层 提升 算法 )。 实验 结果 表明 , 组 合 模型 比 任何 单一 分 类 模 


只 


kt 有 更 好 的 分 类 结 
预测 方法 。 
序 ， 进 行 特征 相关 性 


一 种 有 效 的 道路 交通 事故 严重 程度 
基于 组 合 模型 优秀 的 分 类 结果 ， 对 特征 进行 重要 性 


aunt 


名 交通 事故 严重 等 级 提供 参 
言 息 共享 平台 的 要 求 ， 本 数据 不 得 对 外 发 布 、 传 播 ， 因 此 在 此 
公开 本 实验 相关 代码 ， 


分 析 ， 最 终 为 减少 道路 交通 事故 及 减轻 
意见 。 根 据 道路 交通 安全 而 


dl 


九 


详 见 https://github.com/SXHSine/ 


TrafficAccidentAnalysis。 


ees 


有 时 空 关 联 性 ， 


在 将 来 的 研究 


中 ， ee 
woa 道路 的 空间 信息 ， 结 合 
ARE iy cde aero nna 
路 交通 事故 严重 程度 ， 并 分 析 致 灾 原 因 ， 为 避免 事故 的 发 生 提 


供 更 多 建设 性 意见 。 


参考 文献 : 


[1] 


[2] 


2016 年 全 国道 路 交通 事故 数据 统计 [N/OL]. [2017-12-14]. http://www. 
peichang. cn/detail/id18666. html. (Statistics of National Road Traffic 
Accident Data in 2016 [N/OL]. [2017-12-14]. http://www. peichang. cn/deta 
il/id18666. html. ) 

马 壮 林 ， 张 神 视 ， 杨 杨 ， 等 ， 


[J]. 中 国安 全 科学 学 报 , 2015, 25 (5): 75-79. (Ma Zhuanglin, Zhang Yiyi, 


公路 隧道 交通 事故 严重 程度 预测 模型 研究 


Yang Yang, et al. Research on models for predicting severity of traffic 


类 型 


故 类 型 "关系 图 (KDE 图 ) 


[3] 


[4] 


[5] 


[9] 


He Se 


事故 类 型 


he He BB BS DD BS 


事故 类 型 


accident in highway tunnel [J]. China Safety Science Journal, 2015, 25 (5): 
75-79. ) 

孙 重 静 , 辛 飞 飞人 车 冲突 风险 度 评 价 指标 计算 研究 综述 [J]. 交通 信 
息 与 安全 ,2016, 34 (2): 9-16. (Sun Chongjing, Xin Feifei. An overview of 
the conflict indicators between vehicles and pedestrians [J]. Journal of 
Transport Information and Safety, 2016, 34 (2): 9-16. ) 

IJt, BAA, EH, 


度 时 空 分 析 [I]. 


. 基于 累积 Logistic 模型 的 交通 事故 严重 
中 国安 全 科学 学 报 , 2011, 21 (9): 94-99. (Ma 
Zhuanglin, Shao Chunfu, Dong Chunjiao, et al. Temporal-spatial analysis 
model of traffic accident severity based on cumulative logistic model [J]. 
China Safety Science Journal, 2011, 21 (9): 94-99. ) 

修 树 展 ， 孙 小 端 MBA, 等 . 高 速 公路 交通 事故 严重 程度 与 交通 流 特 
征 的 关系 研究 [J]. 中 国安 全 科学 学 报 , 2011, 21 (9): 106-112. (Hou 
Shuzhan, Sun Xiaoduan, He Yulong, et al. Relationships between crash 
severity and traffic flow characteristics on freeways [J]. China Safety 
Science Journal, 2011, 21 (9): 106-112. ) 

刘海 珠 . 道路 交通 事故 严重 程度 影响 因素 分 析 及 预测 模型 建立 [D]. 
KÄ: 吉林 大 学 ,2014. (Liu Haizhu. The analysis of influencing factors for 
crash severity and the establishment of predication model [J]. Changchun: 
Jilin University, 2014. ) 

Be, ERA, 张 兰 芳 . 城市 道路 交通 事故 严重 程度 影响 因素 分 析 [I]. 
重庆 交通 大 学 学 报 : 自然 科学 版 , 2014, 33 (1): 111-114. (Ma Zhu, Chen 
Yu, Zhang Lanfang. Influence factors of accident severity for urban road [J]. 
Journal of Chongqing Jiaotong University: Natural Sciences, 2014, 33 (1): 
111-114. ) 

Fogue M, Garrido P, Martinez F J, et al. Using data mining and vehicular 
networks to estimate the severity of traffic accidents [M]// Management 


Intelligent Systems. Berlin: Springer, 2012: 37-46. 


Sameen M I, Pradhan B. Severity Prediction of traffic accidents with 


录用 稿 


recurrent neural networks [J]. Applied Sciences, 2017, 7 (6) . 

[10] Khera D, Singh W. A review on injury severity in traffic system using 
various data mining techniques [J]. International Journal of Computer 
Applications, 2014, 100 (3): 17-22. 

[11] Gupta M, Solanki V K, Singh V K. A novel framework to use association 
tule mining for classification of traffic accident severity [J]. Ingenieria 
Solidaria, 2017, 13 (21): 37-44. 

[12] Baru A. Injury severity levels and associated factors among road traffic 
accident victims referred to emergency departments of selected public 
hospitals in Addis Ababa, Ethiopia: the study based on haddon matrix [J]. 
2017. 

[13] O'Donnell C J, Connor D H. Predicting the severity of motor vehicle 
accident injuries using models of ordered multiple choice [J]. Accident 
Analysis & Prevention, 1996, 28 (6): 739-753. 

[14] HF, AMP. 交通 安全 工程 [M]. 北京 : 中 国 铁道 出 版 社 , 2011. 
(Xiao Guiping, Zhu Xiaoning. Road safety engineering [M]. Beijing: China 
Railway Publishing House, 2011. ) 

[15] Fukushima K, Miyake S. Neocognitron: a self-organizing neural network 
model for a mechanism of visual pattern recognition [M]// Competition and 
cooperation in Neural Nets. Berlin: Springer, 1982: 267-285. 

[16] LeCun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to 
document recognition [J]. Proceedings of the IEEE, 1998, 86 (11): 2278- 
2324. 


[17] Convolutional Neural networks (LeNet): DeepLearning 0. 1 documentation. 


TY 
预测 方法 


/会 人 F 


交通 事故 严重 程度 


DeepLearning 0. 1. LISA Lab. [2013-08-31]. 

[18] Olshausen B A. Emergence of simple-cell receptive field properties by 
learning a sparse code for natural images [J]. Nature, 1996, 381 (6583): 607- 
609. 

[19] LeCun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to 
document recognition [J]. Proceedings of the IEEE, 1998, 86 (11): 2278- 
2324. 

[20] Sabes P N, Jordan M I. Advances in neural information processing systems 
[C]// Advances in Neural Information Processing Systems. 1995. 

[21] Krizhevsky A, Sutskever I, Hinton G E. ImageNet classification with deep 
convolutional neural networks [J]. Communications of the ACM, 2017, 60 
(2): 2012. 

[22] Chen Tianqi, Guestrin C. XGBoost: a scalable tree boosting system [C]// 
Proc of the 22nd ACM SIGKDD International Conference on Knowledge 
Discovery and Data Mining. New York: ACM Press, 2016: 785-794. 

[23] Chen Tiangi, He Tong, Benesty M, ef al. XGBoost: extreme gradient 
boosting [EB/OL]. (2017) https://cran.r-project.org/web/packages/ 
xgboost/vignettes/xgboost. pdf. 

[24] Friedman J H. Greedy function approximation: a gradient boosting machine 
[J]. Annals of Statistics, 2001, 29 (5): 1189-1232. 

[25] Schapire R E, Singer Y. Improved boosting algorithms using confidence- 
rated predictions [J]. Machine Learning, 1999, 37 (3): 297-336. 

[26] Zhou Zhihua, Feng Ji. Deep forest: towards an alternative to deep neural 


networks [J]. arXiv preprint arXiv: 1702. 08835, 2017. 


